L’objectif de cette cinquième série de modèles est de commencer à approcher la notion d’espace social grâce à des analyses factorielles (ACM).
L’espace social des pauvretés monétaire, institutionnelle et subjective des données du Baromètre se structure en deux principaux axes dont l’interprétation (délicate) pourrait être la suivante :
| Gauche / Bas | Droite / Haut | |
|---|---|---|
| Axe 1 | Richesse (objective et ressentie) | Pauvreté (objective et ressentie) |
| Axe 2 | Vulnérabilité vis à vis de la pauvreté / halo / risque ressenti de devenir pauvre | Ancrage dans la richesse / pauvreté |
On voit nettement que le sentiment de pauvreté se situe à droite et le sentiment de risque de pauvreté se situe en bas, arguments qui permettent de conforter un peu l’interprétation faite de ces axes.
Voir les résultats statistiques plus bas.
#chargement des packages
library(knitr)
library(dplyr) #manipuler les bases de données
library(FactoMineR) #pour les analyses factorielles
library(explor) #contient FactoMineR
actives_autres <- c("quantile_nivie", "presta_rsa","presta_chomage","presta_apl")
actives_subj <- c("subj_pauvrete_et_risque", "subj_inf_mini_decla")
actives <- c(actives_subj,actives_autres)
passives <- c("revenus_financiers","revenus_locatifs","presta_handi","statut_occup", "diplome", "conn_rsa","annee_fac", "prof_statut_act", "age_tranche","vie_fam")
bdd_acm <- bdd_logit %>%
select(c(all_of(actives),all_of(passives))) %>%
tidyr::drop_na()
res.mca <- MCA(bdd_acm,quali.sup=(length(actives)+1):(ncol(bdd_acm)),
graph=FALSE)
#explor(res.mca)
res <- explor::prepare_results(res.mca)
Les trois premiers axes de l’ACM (qui conservent respectivement 24,7, 12,4 et 10,8 % de l’inertie) sont les suivants. Le saut d’inertie entre les axes 2 et 3 est faible et les résultats de l’axe 3 nous invitent à structurer l’espace uniquement selon les deux premières dimensions.
Le premier axe (horizontal figure 1) oppose clairement à droite les personnes pauvres monétairement (premier quintile de niveau de vie), institutionnellement (RSA en particulier et APL et allocation chômage dans une moins mesure) et subjectivement (sentiment de pauvreté et revenu inférieur au minimum déclaré) et à gauche les personnes plus riches (Q5,Q4, non pauvre, non inférieur au minimum déclaré, et dans une moindre mesure n’étant pas bénéficiaires de prestations sociales).
Le deuxième axe (vertical) est assez original à interpréter. Avec les Q1 et Q5 qui sont au même niveau en haut et s’opposent aux Q2 et Q3 en bas. Une interprétation probable est que cet axe semble opposer les personnes très riches (Q5) ou très pauvre (Q1, RSA, sentiment de pauvreté) en haut de l’axe à des personnes légèrement moins pauvres mais vulnérables, pouvant basculer dans la pauvreté en bas (Q2, Q3, risque ressenti de pauvreté dans 5 ans, au chômage).
[Le troisième axe (horizontal figure 2) ne se structure que par rapport aux quintiles de niveau de vie mais oppose Q2 + Q5 (à droite) à Q3 + Q4 (à gauche). Son interprétation en est rendu difficile et brouillerait le message des deux premiers axes.]
xlim <- c(-1.61, 2.74)
ylim <- c(-2.28, 2.07)
explor::MCA_var_plot(res, xax = 1, yax = 2, var_sup = TRUE, var_sup_choice = NULL,
var_lab_min_contrib = 0, col_var = "Variable", symbol_var = "Type", size_var = NULL,
size_range = c(10, 300), labels_size = 10, point_size = 56, transitions = TRUE,
labels_positions = NULL, labels_prepend_var = FALSE, xlim = xlim,
ylim = ylim)
explor::MCA_var_plot(res, xax = 3, yax = 2, var_sup = TRUE, var_sup_choice = NULL,
var_lab_min_contrib = 0, col_var = "Variable", symbol_var = "Type", size_var = NULL,
size_range = c(10, 300), labels_size = 10, point_size = 56, transitions = TRUE,
labels_positions = NULL, labels_prepend_var = FALSE, xlim = xlim,
ylim = ylim)
Axe 1
Axe 2
Axe 3
Ci-dessous quelques nuages des +11 000 individus colorés selon certaines variables catégorielles actives. On voit sur ce nuage uniquement quelques centaines d’individus car nombre d’entre eux se ressemblent selon les variables actives (peu de variables et donc souvent mêmes modalités répondues).
subj_pauvrete_et_risque qui rassemble sentiment de pauvreté (indiquer se sentir pauvre, à droite) et risque de pauvreté (indiquer ne pas se sentir pauvre mais penser risquer l’être dans les 5 prochaines années, en bas) a un positionnement en triangle qui illustre l’importance fondamentale que cette variable a dans la constitutions des deux axesAxe 1
Axe 2
Axe 3
(ou plutôt richesse comme il s’agit des revenus financiers et locatifs).
Quand on les met en variables actives, elles déterminent un axe à elles seules de par leur spécificité. Je les ai donc gardées en supplémentaires.
En supplémentaires, ces deux variables se rapprochent de Q5 et Q4. En revanche, l’absence de revenus de location et financier se rapproche du centre de l’ACP. C’est assez logique dans le sens ou ces types de revenus concernent des personnes fortunées.
Les professions et statuts d’emploi ont des positions assez marquées sur les axes de l’ACM comparées aux autres variables en supplémentaire.
Vie familiale et tranche d’âge se positionnent selon la même logique, en particulier selon l’axe horizontal.
Ce dernier graphique présente les dernières modalités, qui se démarquent peu sur cette ACM. Le graphique a d’ailleurs été zoomé car tout s’agglutinait au centre des deux axes. Quelques variables particulières à noter cependant :
actives <- c("quantile_nivie", "presta_rsa","presta_chomage","presta_apl")
passives_autres <- c("revenus_financiers","revenus_locatifs","presta_handi","statut_occup", "diplome", "conn_rsa","annee_fac", "prof_statut_act", "age_tranche","vie_fam")
passives_subj <- c("subj_pauvrete","subj_risque_pauvrete", "subj_inf_mini_decla")
passives <- c(passives_subj,passives_autres)
bdd_acm <- bdd_logit %>%
select(c(all_of(actives),all_of(passives))) %>%
tidyr::drop_na()
res.mca <- MCA(bdd_acm,quali.sup=(length(actives)+1):(ncol(bdd_acm)),
graph=FALSE)
res <- explor::prepare_results(res.mca)
Les deux premiers axes de l’ACM (qui conservent respectivement 26 et 15 % de l’inertie) sont les suivants.
Le premier axe (horizontal) oppose clairement à droite les personnes pauvres monétairement (premier quintile de niveau de vie) et institutionnellement (RSA en particulier et APL et allocation chômage dans une moins mesure) et à gauche les personnes plus riches (Q3, Q4 et Q5, n’étant pas bénéficiaires de prestations sociales).
Le deuxième axe (vertical) apparaît plus difficile à interpréter. Avec les Q1 et Q5 qui sont au même niveau en bas et s’opposent au Q2. Une interprétation possible est que cet axe semble opposer les personnes très riches (Q5,Q4) ou très pauvre (Q1, RSA) en bas de l’axe à des personnes légèrement moins pauvres mais vulnérables, pouvant basculer dans la pauvreté en haut (Q2, au chômage).
explor::MCA_var_plot(res, xax = 1, yax = 2, var_sup = TRUE, var_sup_choice = NULL,
var_lab_min_contrib = 0, col_var = "Variable", symbol_var = "Type", size_var = NULL,
size_range = c(10, 300), labels_size = 10, point_size = 128, transitions = TRUE,
labels_positions = "auto", labels_prepend_var = FALSE, xlim = c(-1.42, 3.24),
ylim = c(-2.26, 2.41))
Ci-dessous quelques nuages des +11 000 individus colorés selon certaines variables catégorielles actives. On voit sur ce nuage uniquement une cinquantaine d’individus car nombre d’entre eux se ressemblent selon les variables actives (peu de variables et donc souvent mêmes modalités répondues).
Quand on regarde le nuage des individus, on se rend compte que l’interprétation de ces différentes variables de pauvreté sujective projetées en supplémentaires est délicate (ellipses se superposent beaucoup, en particulier pour les deux derniers). Mais s’il fallait interpréter leur centroïde uniquement, nous dirions quelque chose comme ce qui suit…
(ou plutôt richesse comme il s’agit des revenus financiers et locatifs).
Quand on les met en variables actives, elles déterminent un axe à elles seules de par leur spécificité. Je les ai donc gardées en supplémentaires.
En supplémentaires, ces deux variables se rapprochent de Q5. En revanche, l’absence de revenus de location et financier se rapproche du centre de l’ACP. C’est assez logique dans le sens ou ces types de revenus concernent des personnes fortunées.
Les professions et statuts d’emploi ont des positions assez marquées sur les axes de l’ACM comparées aux autres variables en supplémentaire.
Vie familiale et tranche d’âge se positionnent selon la même logique, en particulier selon l’axe horizontal.
Ce dernier graphique présente les dernières modalités, qui se démarquent peu sur cette ACM. Le graphique a d’ailleurs été zoomé car tout s’agglutinait au centre des deux axes. Quelques variables particulières à noter cependant :
Bilan
Pour ces modèles quatre vagues du Baromètre ont été empilées : 2016, 2017, 2018 et 2019 (12 114 observations) mais seules 10 555 observations sont conservées (celles qui n’ont aucune variable manquante pour l’ensemble des variables utilisées, actives comme supplémentaires).